期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 基于动态加权函数的集成分类算法
王乐, 韩萌, 李小娟, 张妮, 程浩东
《计算机应用》唯一官方网站    2022, 42 (4): 1137-1147.   DOI: 10.11772/j.issn.1001-9081.2021071259
摘要402)   HTML12)    PDF (838KB)(99)    收藏

针对数据流集成分类如何使分类器适应不断变化的数据流,调整基分类器的权重选择合适的分类器集合的问题,提出了一种基于动态加权函数的集成分类算法。首先,提出了一种加权函数调节基分类器的权重,使用不断更新的数据块训练分类器;然后,使用一个新的权重函数对候选分类器进行一个合理的选择;最后,在基分类器中应用决策树的增量性质,实现对数据流的分类。通过大量实验发现,基于动态加权函数的集成分类算法的性能不受块的大小影响,与AUE2算法相比,叶子数平均减少了681.3、节点数平均减少了1 192.8,树的深度平均减少了4.42,同时相对地提高了准确率,降低了消耗时间。实验结果表明该算法在对数据流进行分类时不但可以保证准确率还可以节省大量的内存空间和时间。

图表 | 参考文献 | 相关文章 | 多维度评价
2. 基于正负效用划分的高效用模式挖掘方法综述
张妮, 韩萌, 王乐, 李小娟, 程浩东
《计算机应用》唯一官方网站    2022, 42 (4): 999-1010.   DOI: 10.11772/j.issn.1001-9081.2021071268
摘要348)   HTML38)    PDF (1254KB)(319)    收藏

高效用模式挖掘(HUPM)是新兴的数据科学研究内容之一,通过考虑事务数据库中项的单位利润和数量,以提取出更有用的信息。传统的HUPM方法假定所有项的效用值均为正,但是在实际应用中,某些数据项的效用值可能为负(如商品因产生亏损而导致利润值为负),含负项的模式挖掘与仅含正项的模式挖掘同样重要。首先,阐述了HUPM的相关概念,并分别给出相应正负效用的实例;然后,以正与负角度划分了HUPM方法,其中带有正效用的模式挖掘方法进一步以动态与静态的数据库新颖角度划分,带有负效用的模式挖掘方法中包括了基于先验、基于树、基于效用列表和基于数组等关键技术,并从不同方面对这些方法进行了讨论和总结;最后,给出了现有HUPM方法的不足和下一步研究方向。

图表 | 参考文献 | 相关文章 | 多维度评价
3. 基于准确率爬坡的动态加权集成分类算法
李小娟, 韩萌, 王乐, 张妮, 程浩东
《计算机应用》唯一官方网站    2022, 42 (1): 123-131.   DOI: 10.11772/j.issn.1001-9081.2021071234
摘要251)   HTML11)    PDF (992KB)(71)    收藏

传统集成分类算法中,一般将集成数目设置为固定值,这可能会导致较低分类准确率。针对这一问题,提出了准确率爬坡集成分类算法(C-ECA)。首先,该算法不再用一些基分类器去替换相同数量的表现最差的基分类器,而是基于准确率对基分类器进行更新,然后确定最佳集成数目。其次,在C-ECA的基础上提出了基于爬坡的动态加权集成分类算法(C-DWECA)。该算法提出了一个加权函数,其在具有不同特征的数据流上训练基分类器时,可以获得基分类器的最佳权值,从而提升集成分类器的性能。最后,为了能更早地检测到概念漂移并提高最终精度,采用了快速霍夫丁漂移检测方法(FHDDM)。实验结果表明C-DWECA的准确率最高可达到97.44%,并且该算法的平均准确率比自适应多样性的在线增强(ADOB)算法提升了40%左右,也优于杠杆装袋(LevBag)、自适应随机森林(ARF)等其他对比算法。

图表 | 参考文献 | 相关文章 | 多维度评价